Scopo di questo report è quello di esplorare e analizzare la natura della sparatorie avvenute a New York dal 2006 fino alla fine del 2020, attraverso analisi descrittive, tassi sulla popolazione, grafici e mappe.

Parole chiave: analisi dati, NYPD, Mappe, R, Google maps.

Il caso studio

I dati presi in considerazione rappresentano una ripartizione di ogni sparatoria avvenuta a New York dal 2006 fino alla fine del 2020. Questi dati vengono estratti manualmente ogni trimestre e rivisti dall’Office of Management Analysis and Planning prima di essere pubblicati sul sito Web del NYPD, dove si sono scaricati https://data.cityofnewyork.us/Public-Safety/NYPD-Shooting-Incident-Data-Historic-/833y-fsy8. Ogni record rappresenta una sparatoria avvenuta nella città di New York e include informazioni sull’evento: il luogo in cui si è verificato; informazioni relative ai dati demografici dei sospetti e delle vittime.

Analisi preliminare

Caricamento delle librerie e del dataset:

library(sf)
library(maps)
library(pamr)
library(ggplot2)
library(rgdal)
library(png)
library(grid)
library(cluster)
library(rgdal)
library(ggmap)
library(jsonlite)
library(RCurl)
library(readr)
library(dplyr)
library(leaflet)
library(httr)
library(gridExtra)

NYPD <- read_delim("NYPD_Shooting_Incident_Data__Historic_.csv", 
                 ";", escape_double = FALSE, trim_ws = TRUE)
dim(NYPD)
## [1] 23585    19

Il dataset contiene 23585 record per 19 variabili, che sono:

names(NYPD)
##  [1] "INCIDENT_KEY"            "OCCUR_DATE"             
##  [3] "OCCUR_TIME"              "BORO"                   
##  [5] "PRECINCT"                "JURISDICTION_CODE"      
##  [7] "LOCATION_DESC"           "STATISTICAL_MURDER_FLAG"
##  [9] "PERP_AGE_GROUP"          "PERP_SEX"               
## [11] "PERP_RACE"               "VIC_AGE_GROUP"          
## [13] "VIC_SEX"                 "VIC_RACE"               
## [15] "X_COORD_CD"              "Y_COORD_CD"             
## [17] "Latitude"                "Longitude"              
## [19] "Lon_Lat"
head(NYPD[, c(1,4,8,12:14, 17:18)])
## # A tibble: 6 × 8
##   INCIDENT_KEY BORO     STATISTICAL_MUR… VIC_AGE_GROUP VIC_SEX VIC_RACE Latitude
##          <dbl> <chr>    <lgl>            <chr>         <chr>   <chr>       <dbl>
## 1     24050482 BRONX    TRUE             25-44         F       BLACK H…     40.9
## 2     77673979 QUEENS   FALSE            65+           M       WHITE        40.7
## 3    203350417 BROOKLYN FALSE            18-24         F       BLACK        40.7
## 4     80584527 BRONX    FALSE            <18           M       BLACK        40.8
## 5     90843766 QUEENS   FALSE            18-24         M       BLACK        40.6
## 6     92393427 BROOKLYN FALSE            <18           M       BLACK        40.6
## # … with 1 more variable: Longitude <dbl>

Per le analisi si utilizzeranno le variabili relative alla posizione dell’avvenuta sparatoria tramite latitudine e longitudine; la variaibile dei distretti dove è avvenuta; se ha provocato delle morti; infine le caratteristiche demografiche delle vittime.

Prima di tutto, si vuole analizzare la distribuzione delle sparatorie per distretto:

La stessa informazione si può visualizzare sottoforma di mappa, utilizzando le coordinate geografiche. Ogni sparatoria ha le sue coordinate geografiche, con la funzione ..level.. viene calcolata la densità spaziale del numero di sparatorie per metro quadro.

ggmap(nyc_map)+
stat_density2d(data = NYPD,
aes(x = Longitude, y = Latitude, fill= ..level.., alpha=..level..),
alpha=0.15,
bins=30,
geom = "polygon") +
scale_fill_gradient(low = "red", high = "blue", name="Shootings level per square meter") +
scale_alpha(range = c(0, 0.08), guide = "none") +
scale_size(range = c(0,0.75)) +
ggtitle("Shootings for Boroughs")+


theme(axis.ticks = element_blank(),
axis.text = element_blank(),
legend.position="right") +
theme(plot.title = element_text(hjust = 0.5))

I valori della distribuzione di frequenza vanno confrontati con la popolazione residente. Si sceglie di valutare i tassi di sparatorie in base alla popolazione dei distretti di New York per 100.000 abitanti. Nel 2020\(^{(1)}\), anno di chiusura di questo studio, si sono registrati:

Pertanto risulta che, nonostante a Brooklyn si registrino più sparatorie nel totale, il tasso specifico delle sparatorie a New York è di molto maggiore nel distretto del Bronx.

Siccome, la concentrazione delle sparatorie non è equiparata, si decide di affrontare l’analisi per distretti per cogliere le differenze principali tra questi.

Brooklyn

Nel distretto di Brooklyn si sono registrati 9734 incidenti, cioè il 41.3% del totale, con un tasso specifico di 244.91 per 100.000 abitanti. Tra questi, il 19.5% hanno causato morti, rispetto al restante 80.5%.

ny.map_brooklyn <- get_map("Brooklyn, New York, NY",zoom=12)

map_brooklyn<-ggmap(ny.map_brooklyn, 
      base_layer = ggplot(data = ny_brookl  , aes(x = Longitude, y = Latitude))) + 
  geom_point(aes(fill = Murder, col = Murder), alpha = 0.5, size = 1) +
  scale_color_manual(values = c("#0105cd","#ff19fc"))
map_brooklyn

Tra le vittime il 90.5% sono di sesso maschile e il 9.5% sono di sesso femminile. Inoltre, la classe di età più colpita sembra essere quella tra i 24-44 (44.3%). Infine, l’etnia afroamericana sembra essere la più colpita (83.4%) e la seconda sembra essere la categoria degli ispanici (12.8%).

Bronx

Nel distretto del Bronx si sono registrati 6701 incidenti, cioè il 28% del totale, con un tasso specifico di 445.03 per 100.000 abitanti. Tra questi, il 18.6% hanno causato morti, rispetto al restante 81.4%.

Tra le vittime il 91.3% sono di sesso maschile e il 8.7% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (41.4%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (57.2%), la seconda sembra essere la categoria degli ispanici (39.9%), di molto superiore alla percentuale delle vittime della stessa categoria di Brooklyn.

Queens

Nel distretto del Queens si sono registrati 3532 incidenti, cioè il 15% del totale, con un tasso specifico di 140.39 per 100.000 abitanti. Tra questi, il 19.7% hanno causato morti, rispetto al restante 83.3%.

Tra le vittime il 90% sono di sesso maschile e il 10% sono di sesso femminile. La classe di età più colpita è quella tra i 25-44 (46.1%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (72.7%), la seconda sembra essere la categoria degli ispanici (19.2%), di molto inferiore alla percentuale delle vittime della stessa categoria di Bronx.

Manhattan

Nel distretto del Manhattan si sono registrati 2922 incidenti, cioè il 12% del totale, con un tasso specifico di 172.47 per 100.000 abitanti. Tra questi, il 17.6% hanno causato morti, rispetto al restante 82.4%.

Tra le vittime il 94.4% sono di sesso maschile e il 9.6% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (44.2%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (66.62%) e la seconda sembra essere la categoria degli ispanici (33%), simile alla percentuale delle vittime della stessa categoria di Bronx.

Staten Island

Nel distretto di Staten Island si sono registrati 696 incidenti, cioè il 3% del totale, con un tasso specifico di 146.83 per 100.000 abitanti. Tra questi, il 20.5% hanno causato morti, rispetto al restante 79.5%.

Tra le vittime il 88.9% sono di sesso maschile e il 11.1% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (42.1%). Infine, l’etnia afroamericana sembra essere la più colpita (70.8%), la seconda più colpita sembra essere la categoria degli ispanici (18.1%), mentre cresce la percentuale delle vittime bianche rispetto agli altri distretti (10.3%).

Confronto tra distretti in base alla popolazione

Come si è accertato prima, tali informazioni possono variare in base alla popolazione presente sul territorio, in particolare per l’etnia dove si registrano nel 2020 diverse concentrazioni all’interno dei distretti.

Population %>%
  kbl(caption = "Population 2020 by race among the Boroughs in millions") %>%
  kable_styling()
Population 2020 by race among the Boroughs in millions
Boroughs Black Hispanic White Other
Brooklyn 968.427 516.426 729.696 408.355
Staten Island 46.835 96.960 277.981 62.653
Manhattan 199.592 402.640 793.294 235.736
Queens 381.375 667.861 549.358 722.758
Bronx 419.393 806.463 130.796 87.632

Pertanto, calcolando i tassi specifici in base all’etnia per i distretti risulta che:

  • l’etnia afroamericana resta la più colpita, siccome il tasso specifico è molto maggiore rispetto alle altre categorie nei distretti. Il maggior tasso si registra nel distretto di Staten Island (1052.53 per 100.000 abitanti), dove nonostante ci sia meno concentrazione di popolazione afroamericana, questi vengono più colpiti;

  • l’etnia ispanica viene più colpita nel ditretto del Bronx (331.7 per 100.000 abitanti), dove è anche l’etnia più presente;

  • l’etnia bianca viene più colpita nel distretto di Manhattan (121.46 per 100.000 abitanti), dove è anche l’etnia più presente.

Infine, si è prodotta una mappa interattiva dove vengono evidenziate le sparatorie in base ai quartieri, dove il colore rosso acceso indica che in quel punto di coordinate si sono verificate più sparatorie.

Nonostante Manhattan registri un tasso relativamente basso di sparatorie rispetto agli altri distretti (172.47 per 100.000 abitanti residenti a Manhattan), si può notare che i quartieri di Manhattan più vicini al Bronx, dove si registra quello più alto in generale (455.03 per 100.000 abitanti residenti nel Bronx), siano quelli lo influenzano maggiormente.

######### TOTALE SPARI
#RdYlBu <- colorFactor("RdYlBu", domain = NYPD$STATISTICAL_MURDER_FLAG)  
leaflet(nyc_neighborhoods) %>%
  addCircles(lat = ~points$lat , lng = ~points$lng, #layerId = points$neighborhood
             radius = 30,
             weight = 20,
             stroke = FALSE,
             #fillColor = ~NYPD$STATISTICAL_MURDER_FLAG,
             fillOpacity = 0.2,
             #color = c("#OC6AF7","#00FA14")
             color = "red",
             ) %>% 
  addTiles() %>% 
  addPolygons(popup = ~neighborhood) %>%
  addProviderTiles("CartoDB.Positron")

Conclusioni

Lo scopo di questo report era quello di esplorare e analizzare la natura della sparatorie avvenute a New York dal 2006 fino alla fine del 2020, attraverso analisi descrittive, tassi sulla popolazione, grafici e mappe.

Il maggior numero di sparatorie in base alla popolazione residente è avvenuta nel Bronx, dove si è osservato che le vittime più colpite sono di etnia afroamericana, seguite da quelli di etnia ispanica. Inolte, si nota che la vicinanza dei quartieri di Manhattan alle zone appartenenti al distretto del Bronx sembra avere un impatto crescente sul tasso di sparatorie nel distretto di Manhattan.

Sulla base di questi risultati, si potrebbe approfondire l’analisi relativa alla possibile influenza del fenomeno nei quartieri di Manhattan confinanti con il Bronx.

Bibliografia

(1): Per le stime della popolazione di New York: https://www1.nyc.gov/site/planning/planning-level/nyc-population/2020-census.page